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® Verfatiren zurn Verschleiern von Fehlern in einem Audiodatenstrom 

© Bei einem Verfahren zurn Verschleiern von Fehlern in 
einem Audiodatenstrom wird in dem Audiodatenstrom 
das Auftreten eines Fehlers erfaSt, wobei Audiodsten vor 
Auftreten des Fehlers intakte Audiodaten sind. Ansch lie- 
Bend wird eine spektrale Energie einer Untergruppe der 
intakten Audiodaten berechnet Nach dem Bilden einer 
Vor! age fur Ersatz date n aufgrund der fur die Untergruppe 
der intakten Audiodaten berechneten spektralen Energfe 
warden Ersatzdaten fur fehlerhafte odar nfcht vorhande- 
ne Audiodaten, die der Untergruppe errtsprechen, auf- 
grund der Voriage erzeugt 
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Beschreibiing 

Die voriiegendc Erfindung bezieht sich auf Audiccodier- 
vcrfahrcn und insbesonderc auf Fchtevexschlcierungstech- 
rriken beim Codieren vod Audiosignalen. 

Das sogenannte Tniemet Radio Broadcasting", d h. das 
ubertragen eines Radioprogramms live uber das Internet, er- 
fordert es, Tausende von Ecbtzdtvcrbindungen zwischen ei- 
nem Sender und Brnpfangeipi ogiamrnen, die sich beispiels- 
weise in einern Personalcotnputer eines Iiitemetteilnehmers 
befinden, aufzubauen. 

Das derzeit am haufigsten verbreitetc Intcrnet-Protokoll 
httpstellt eine feMerfreie Obertragung sicher; dasselbe be- 
sitzt jedoch kedne Echtzritrigenschaften. Dieses Protokoli 
bedingt cine zur Anzahl der empfangenen Stationen propor- 
tionale Netzlast beim Sendee Somk ist die Anzahl der 
gleichzeitigen H5rerje nach Datenrate des codierten Signals 
typischerweise auf wenige Hundert begrenzt, was fur 
Hfcundfurikanwendungen", dh. Anwendungen, bei denen 
Radio- oder Femsehsignale ubertragen werden sollen, si- 
cher nicht aiisreicht 

Neue Protokolle zur tJbertragung von Daten fiber das In- 
ternet, wie z. B. rtp (rtp = realtime transmission protocol = 
EditzeitObertragungsprotokoll), umgehen diesen Flaschen- 
hals, indem sie im Gegensatz zu dem Protokoli http Fehler 
in der Obextragung zulassen. 

Dadurch stelll sich fur den Empfanger das Problem, wie 
er mit fehlerhaften Obertragungsdaten umgehen soli Wie 
wind beispielsweise das Fehlen von Tbilen eines Multime- 
dia- oder Audiodatenstroms fibeibriickt? 

Zur Fehlerbehandlung sind im Stand der Technik einige 
Verfahren bereits bekannt Beim \ferfahren des Stumm- 
schaltens, welches die einfachste Art der Fehlerverschlde- 
rung ist, wird die Wiedergabe abgeschaltet, solange Daten 
fehlen oder fehlerhaft sind Die fehlenden Daten werden 
durch ein Nullsignal ersetzt Aufgrund psychoakustischer 
Effekte wind dieses pldtzliche AbfaUen und Ansteigen der 
Sig nalenenzie als sehr unan g enehm E^rp fiL^dgg.^EiJD 



Stummschaltverfahren ist beispielsweise in Detlef Wiesc: 
"Error Concealment Strategies for Digital Audio Broadca- 
sting 0 , 92. AES Convention, Wien 1992, Preprint 3264, und 
in Detlef Wiese: "Anwendung von FerderverschleLerungs- 
techniken fur digitalen H5rrundfunk (DAB)", 9. JTG-Fach- 
tagung "Htoundfunk", Mannheim 2/92, beschrieben. 

Ein weiteres bekanntes Verfahren ist das Verfahren der 
Datenwiederhoiung. Fallt ein Datenstrom aus, wild ein leil 
der zuletzt gesendeten Daten in einer Schleife wiederholt 
Bei blockorientierten Verfahren, welche die Mehrheit be- 
kannter Audiococfiexverfahren sind, wurden also beispiels- 
weise der oder die zuletzt empfangenen Blocke wiederholt 
Ein derartiges Verfahren ist aus den bereits zitiertcn litera- 
tursteUen bekannt 

Dieses Verfahren fiihrt jedoch zu stQrenden Artefakten* 
Werden nur kurze Teile des Audiosignals wiederholt, so 
klingt das repetierte Signal — unabhangig vom Qriginalsi- 
gnal - maschinenartig mit einer Grundfrequenz bei der Wie- 
derhot&equenz. Werden iangere Teile wiederholt, entstehen 
"EchoefFekte% die ebenfalls als storend empfunden werden. 

Ein weiteres Verfahren, das Verfahren der Dateninterpo- 
lation, baut auf der Wahrschtinlichkeit, daB bei "Dbertragung 
eines Datenstroms mit rclativ hoher \ferzdgerung bereits 
wieder giittige Audiodaten vorliegen, wenn eine Fehler- 
liicke des Audiodatensignals verschleiert werden rnuB. Es 
kann eine Interpolation verwendet werden, urn Daten In der 
LDcke zu generieren, wie es in Laurent Filliat, Mario Rossi, 
Joseph Maisano, "Error Correction by Interpolation in Digi- 
tal Audio", 92. AES Convention, Wien 1992, Preprint 3281, 
beschrieben ist 



Ein Nachteil dieses Vejfahrens bestebt beispielsweise 
darin, daB die Verzpgerung in vielen Fallen nicht hinnehm- 
bar ist, insbesonderc, wenn an Telefonieanwendungen ge- 
dacht wird. 

rem kann die Signalenergie pro Spekrrallinie von einem 
Block auf den nachsten vorhergesagt oder n pr§dizierr wer- 
den. Dieses bckannte Verfahren (Jurgen Herre: "Fehlerver- 
schleaerung bei spektral oodierten Audiosignalen", Disserta- 
10 tion, Universitat Edangen-Numberg, Eriangen 1995) fiihrt 
zwar zu einer guten Fehlerverschleierung, es ist jedoch ein 
relativ hoher Rechenaufwand vonnSten, der derzeit eine 
Echtzeatdecodierung eines empfangenen Multimedia- oder 
Audiodatensignals unmoglich macht 

In der Technik ist es ebenfalls bekannt, die Redundanz im 
Datenstrom zu erhohen. Es ist moglich, in cinen Audioda- 
tenstrom bereits beim Codierer oder Sender einen zweiten 
Datenstrom einzufugen, der dasselbe Signal (bei eventuell 
niedrigerer Datenrate und entsprechend medrigerer Quali- 
ty) Qbertragt Versctzt man diesen zweiten Datenstrom zeit- 
lich gegenuber dem ersteren, so ist es wahrscheinlich, daB 
zu jedem Zeirpunkt wenigstens aus einem der beiden 
Strdme gultige Daten empfangen werden. Sonrit kann der 
Ausfall eines Signals durch das anderc Signal flberbruckt 
werden, Dieses \ferfahren liefert bei fehlerhaftem Hauptsi- 
gnal eine infonnationstreue Wiedergabe, die jedoch fibli- 
cherweise eine schlechtere Qualitat haben wird. 

We auch das vorhergehende Verfahren erhoht dieses Ver- 
fahren die Verzdgening zwischen Sender und Empfanger, 
30 weshalb die gleichen Nachteile wie bei der Daleninterpola- 
tion vorhanden sind* Weiterhin wird die Datenrate erhoht, da 
ja ein zweites gewissermaBen identisches Signal tibertragen 
wird, was insbesondere bei kbinen Datenraten oder verfug- 
baren ubertragungsbandbreiten nicht akzeptabei sein kann. 

Bei dertJbertragung eines Stereosignals existiert ein wei- 
teres Verfahren, urn Fehler in der tJbertragung zu verschlei- 
ern. Bei dem Aferfahren der Idnks/Recht^Ersetzung kann 
Q^_gestorte oder ausgefalleoe Kanal Aurrh fo n jgweals-an^ 



15 



20 



25 



35 



40 



45 



deren Kanal ersetzt werden, wie es in Detlef Wiese: "Error 
Concealment Strategies for Digital Audio Broadcasting", 
92. AES Convention, Wen 1992, Preprint 3264, Detlef 
Wiese: "Anwendung von Fehlennei^hlderungstedaniken 
fur digitalen Horrundfunk (DAB)", 9. ITG-Fachtagung 
"HSmindfunk", Mannheim 2/92, und Jurgen Herre: "Fehler- 
verschleierung bei spektral oodierten Audiosignalen", Dis- 
sertation, Universitat Erlangen-Numberg, Eriangen 1995, 
beschrieben ist Im allgemeinen werden jedoch die Daten 
fur beide XanaLe gleichzeitig tibertragen und daher auch 
gleichzeitig gestort Andemf alls handelt es sich hier urn ei- 
50 nen Spezialfall zum Verfahren der Erhohung Redundanz 
im Datenstrom. Dieses Verfahren karm ferner nur dann an- 
gewendet werden, wenn dex linke und der rechte Kanal un- 
abhangig voneinander decodierbar sind. Es ist jedoch bei- 
spielsweise bei den sogenannten "Joint Stereo"-Mbdi, die 
55 durch den Standard-MPEG Layer-3 deftniert sind, nicht 
moglich. 

Die Aufgabe der vorliegenden Erfindung besteht darin, 
ein Verfahren zum Verschleiern von Fehiern in einem Au- 
diodatenstrom zu schafFen, das eine effektive und moglichst 
60 nicht horbare Fehlerverschleierung erreichL 

Diese Aufgabe wird durch ein Verfahren gemSB An- 
spruch 1 gelost 

Das Verfahren zum Verschleiern von Fehlem in einem 
Audiodatenstrom gemaB der vorliegenden Erfindung urn- 
fafit folgende Schrirte: 

Erf as sen des Auftretens eines Fehlers in einem Andiodaten- 
strom, wobei Audiodaten vor Auftreten des Fehlers intakte 
Audiodaten sind; 



65 



DE 197 35 675 A 1 



Berechnen einer spektralen Energie in einer Untergmppe 
dcr intakteo Audiodaten; 

BUden eincr Vbdagc fur Ersatzdaten aufgmnd der fur die 
Untcrgruppc der intakten Audiodaten berechneten spektra- 
len Energie; und 5 
Erzeugen der Ersatzdaten fur fehlerhafte oder nicht vorhan- 
dene Audiodaten, die der Uatergruppe cntsprechen, auf- 
grand der Nforlage. 

Bine Untergruppe im Sinne dieser Anmeldung umfaBt je- 
weils mehrete anfeinandexfolgende Frequenzlinien, Der 10 
Frequenzbereich wild also in aufeinanderfolgende Unter- 
gruppen eingeteiit, wobei jede Uatergruppe aufeinanderfol- 
gende Frequenzlinien hat Vorzugsweise kdnnen die Unter- 
gruppen den aus der Psycboakustik bekannten Frequenz- 
gruppen entsprecben. Es kann jedoch auch eine von den Fee- L5 
quenzgruppen abweichende Einteilung fur die Untergrup- 
pen gewahlt werden, wie es weiter hinten beschrieben isL 

Wie es aus der spiteren detaUlierten Beschreibung offen- 
sichtlich wird, 16st dieses Verfahren im Stand der Technik 
vorhandene Nachteile, da es weder eine erhQhte \ferzoge- 20 
rung noch einB Erh&hung der Datenrate, d. h. eine Anderung 
der Quellencodierung erfordert, noch die unangenehrne 
Zeit- und Frcquenzstruktur eines einfach repetierten Signal- 
abschnitts aufweist Im Gegensatz beispielsweise zum \fer- 
fahren der spektralen Pr&diktion, das bereits umrissen 25 
wurde, liefert das erfindungsgemaBe Verfahren eine gehd- 
rangepafite Rauschsubstitudon. Ausgegangen wird von ei- 
ner Frequenzdarstellung eines zeitlichen Audiosignals, wel- 
che auf viele fur Fachleute bekannten Arten und Weisen er- 
halten werden kann. Wie es von Zwicker und Fasti in "Psy- 30 
choacoustics, Facts and Models", 1990, dargelegt wurde, 
kann das Spekirum eines Signals in sogenannte Frequenz- 
gruppen gruppiert werden. Dies fuhrt zu einer Skalierung 
der Fiequenzachse in Bark, welche gehorrelevante Eigen- 
Bchaften-berOcksichtigt, und zwar im Gegensatz zu einer tfb- 35 
lichen Skalierung der Frequenzachse in Hertz. Ein Bark ist 
die FrequenzdLfferenz zwischen benaebbarten Frequenz- 
gruppen. Eine Frequenzgruppe ist; wie es'Vori Zwicker deti- ~ 
men wurde, die maximale Bandbreite, innerhalb der die In- 
tensitaten einzelner Tone durch das menschliche Ohr sum- 40 
miert werden, um Hdrschwellen zu bilden. 

Der vorliegenden Erfindung liegt die Erkenntnis zu- 
grunde, daB es fflr eine Fehlerverschleierung ausreicht, ein 
"gut 9 spektral geformtes Zufallssignal zu erzeugen. "Gut" 
bedeutet in diesem Zusammenhang, daB die spektralen 45 
Energien in Frequenzgruppen des Zufalls signals mil den 
spektralen Energien der intakten Audiodaten vor Auftreten 
des Fehlers Qbereinsdmmen bzw. von denselben hergeleitet 
sind. 

Be vor auf verschiedene Ausfuhrungsbeispiele der vorlie- 50 
genden Erfindung eingegangen wird* werden weitere Be- 
griffe, die fur das Verstandnis der Erfindung wesentiich sind, 
kurz edautert 

Wenn in dieser Anmeldung von einer "spektralen Ener- 
gie N einer Frequenzlinie die Rede ist, so wird darunter das 55 
Betragsquadrat dieser beispielsweise durch eine Fourier- 
Transformation errechneten Spektralkomponente vers tan- 
den, Wenn dagegen von der "spektralen Energie" einer Un- 
tergruppe gesprochen wird, so wird darunter die Surntne der 
quadrierten Betrage der Spektralkomponenten in dieser Un- 60 
tergruppe verstanden, welche beispielsweise durch eine 
FcHirier-Transformation erxechnet worden sind. Wichtig ist 
jedoch, anzumerken, daB der Ausdruck "spektrale Energie" 
nicht vollig streng verwendet wird. Wird beispielsweise das 
Verfahren der vorliegenden Erfindung in cinem Codicrer 65 
ausgefiihrt, der nach MPEG Layer- 3 arbeitet, so lauft das 
Verfahren auf der Basis von MDCT-Linien (MDdT = modi- 
fizierte diskrete Cosinus Transformadon) ab. Die dort ver- 



wendete modifizierte diskrete Cosinus Transformation, wel- 
che eine Oberlappung und Fensterung beinhaltet, ist jedoch 
im strengen Sinne nicht eneigieerhaltend. Das bedeutet, da£ 
es keinen einfachen Weg gibt, aus MDCT-Spektren die 
Energie pro Frequenzlinie im Sinne beispielsweise einer 
Fourier-Trarisfbrmation zu finden. Umgekehrt ist es bei 
Kenntnis dieser Energie nicht ohne weiteres moglich, ein 
MDCT-Spekrrum zu erzeugen, das die geforderte Energie 
entbalt. Der Ausdruck " spektral e Energie** bezieht sich also 
sowohl auf die energieerhaltende Fourier-lransformation 
als auch auf die "nLcbt"-energieerhaltende modifizierte dis- 
krete Cosinus Transformation oder auf Shnliche nicht-ener- 
gieerhaltende Transform ationsverf ahren„ welche bekannt 
sind. Die Nutzlichkeit des Verfahiens gemaB der vorliegen- 
den Erfindung hangt alleidings auch nicht von einer ge- 
nauen Energieerhalrung ab, da das Verfahren zum Verschlei- 
em von Fehlern in einem Audiodatenstrom gerade nicht 
eine exakte Wiederberstellung der Ursprungsdaten, welche 
im allgemeinen nicht moglich ist, sondem eben eine Ab- 
schatzung von Ersatzdaten betrifft, die bewirken, daB ein 
aufgetretener Fehler rnoglichst unhorbar und damit ver- 
schleiert wird. 

Weiterhin wird in dieser Anmeldung ofters von Audioda- 
ten vor Auftreten des Fehlers oder von intakten Audiodaten 
gesprochen, Es sei angernerkt, daB sich diese Ausdrucke 
nicht auf den eigentlichen EmpfangsprozeB beispielsweise 
eines vom Internet lesenden Frogranmies bezieht Bei man- 
chen Internet-Protokollen konnen sequentieU abgeschickte 
Datenpakete in anderer Reihenfolge ankomrnen, Wird also 
von Audiodaten vor Auftreten eines Fehlers gesprochen, so 
wird danut nicht auf die Echtzeit B ezug genommen, sondem 
auf die durch den Audiodatenstrom vorgegebene Reihen- 
folge. Weiterhin sei angernerkt, daB Audiodaten vor Auftre- 
ten eines Fehlers selbstverstMndlich zu einem noch frQhecen 
Zeitpunkt ebenf alls fehlemaft bzw. nicht vorhanden gewe- 
sen sein k5nnten. Wenn jedoch in einem Audiodatenstrom 
ein Fehler erfaBt wird, so bedeutet dies, dafi auf jeden Fall 
~vor Auftreten des Fehlers intakte Audiodaten vorhanden ge- 
wesen sind Dies bedeutet also nicht, daB das Verfahren der 
vorliegenden Erfindung lediglich den allerersten Fehler in 
einem Audiodatenstrom behandeln kann. 

Wie bereits erwahnt wurde, wird in dieser Anmeldung das 
unerwartete Nlchtvorhandensein von Audiodaten ebenf alls 
wie das Vorhandensein von fehlerhaften, d. h. teilweise zer- 
storten, Audiodaten als Fehler bezeichnet \Nfenn also fehler- 
hafle Audiodaten durch Ersatzdaten ersetzt werden, so be- 
deutet dies, daB entweder teilweise zerstorte Audiodaten 
durch Ersatzdaten ersetzt werden, oder daB an der S telle, an 
der unerwarteterweise keine Audiodaten vorhanden sind, 
Ersatzdaten eingesetzt werden. 

Wenn femer in dieser Anmeldung davon gesprochen 
wird, daB aufgmnd von intakten Audiodaten spektrale Ener- 
gien berechnet werden, so soli dies nicht bedeuten, daB die 
gesamten intakten Audiodaten zwischen dern aktuellen und 
dem letzten Fehler Yerwendet werden. Start dessen ist die 
Menge der intakten Audiodaten, die den Audiodatenstrom 
vor Auftreten des Fehlers darstellen, von dem einzelnen An- 
wendungsfall abhangig. Bei Ausfuhrungsbeispielen der vor- 
liegenden Erfindung, welche blockbasierend arbeiten, kann 
die Menge der intakten Audiodaten beispielsweise nur Au- 
diodaten des letzten Blocks oder mehrerer letzter Blockc 
umfassen. Femer mussen nicht unbedingt alle intakten Au- 
diodaten beispielsweise eines Blocks verwendet werden, 
sondem lediglich beispielsweise Audiodaten, die Infocma- 
tiooen Obex Energien pro Untergruppe aufweisen. Eine 
Starke des Verf aniens der vorliegenden Erfindung besteht ja 
gerade darin, daB nicht unbedingt alle Frequenzlinien ge- 
speichert und im Fehlerfall pradiziert werden mUssen. Je 
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mehr Audiodaten jedoch zum Bilden einer Voriage fur Er- 
satzdaten verwendet werden, urn so praziser konnen Ersatz- 
daten aus der spektralen Voriage crzeugt werden, urn einen 
Fehler besser zu verschleiern. 

Im nacbfblgenden wird das erfindungsgemSBe Verfahren 5 
anhand eines AudiocodierYerfahrens, das spektral codierte 
Audiodaten erzeugt und Qbertragt, beispielhaft dargestellL 
Die meistca modernen Audioccdierverfahren, wie z. B. 
MPEG Layer 1-3, MPEG AAC, Dolby AC-3, PAC, liefern 
spektral codierte Audiodateo, welche von einem entspre- 10 
cheoden Decodierer empfangen, dccodiert und wieder in 
den Zeitbereich umgesetzt werden. 

We es allgemein bekannt 1st, wird ein zu codierendes 
analoges Signal tnit einer geeigneten Abtastfrequenz, wie 
z. B . 44, 1 kHz, abgetastet, urn ein diskretes Zeitsignal zu er- 15 
halten, En solches diskretes Zeitsignal Vann nun mittels ei- 
ner geeigneten Fensterfiinktion gefbnstert werden, urn 
Blocke nrit einer bestunmten Anzahl von einzelnen zeitdis- 
kreten Signalwerten zu erhalten, welche insbesondere zu 
den Randern der Blocke hin durch die Fensterfunkdoo ge- 20 
wichtet sind, wie es in der Nachrichtentechnik allgemein be- 
kannt ist Ein Block mit mittels einer Fensterfiinktion ge- 
wichteten zeitdiskreten Signalen wird nun mittels eines ge- 
eigneten IVansformationsverf aniens vom Zeitbereich in den 
Frequenzbereich transfomriert Geeignete Transformations- 25 
verfahren konnen eine schnelle FourieatransforniatioQ 
(FFT), ein Filterbankverfahren Oder eine modifizierte dis- 
krete Cosinustransformation (MDCT) sein. Ein Block von 
zeitdiskreten Signalen liegt nach der Transformation als ein 
Block von Fiequeozlinien vor. Der Block von Fiequenzli- 30 
men oder das Frequenzspektrum des Blocks von zeitdiskre- 
ten Signalwerten kann nun quantisiert werden. Unter Be- 
rocksichtigung psychoakustischer Gesichtspunkte ist es un- 
ter besdmmten Voraussetzungen nioglich, eine durch die 
Quantisierung eingefuhrte Quantisierungsstorung derart zu 35 
gestalten, daB sie nicht horbar ist, cL h. daB sie unter der Hor- 
schwelle des menschlichen Gehors liegt, 

Bei modernen Audiocodieiverfabieo werden _ die _nun in 
quantisierter Form vorliegenden Spektrallinien einer Red- 
undanzreduktion, beispielsweise mittels einer Huffman-Co- 40 
dierung, unterzogen und zusammen mit zur Decodierung 
notwendigen Seiteoinforrnationen in einen Audiodaten- 
strom gepackt, der nun zur "Obertragung zu einem Empfan- 
gerbereitstehL 

An dieser Stelle sei angemerkt, daB der Ausdruck "Audio- 45 
datenstrom" in dieser Anmeldung nicht nor wie vorher be~ 
schrieben erzeugte Audiodatenstrome erfafit, sondem jegli- 
che Form von Audiodaten, seien sie codiert oder uncodicrt 
So ist es fur die vorliegende Erfindung nicht erforderlich, 
dafi der Audiodatenstrom in gleichlange Blocke oder fiber- 50 
haupt in Bldcke eingeteilt ist Liegt der Audiodatenstrom je- 
doch spektral codiert in Blockform vor, so kann das erfin- 
dungsgemaVBe Verfahren mit geringstem Aufwand imple- 
mentiert werden. Liegt der Audiodatenstrom in einer ande- 
ren Form vor, so konnen die Audiodaten mittels bekannter 55 
Schritte und Verfahren aufbereitet werden, urn das erfin- 
dungsgemaBe Verfahren durchzufuhren. 

Das Verfahren gemafi der vorliegenden Erfindung weist 
somit vier Schritte auf. Der erste Schritt besteht darin, das 
Auftreten eines Fehler s in einem Audiodatenstrom zu erf as- 60 
sen, der zweite Schritt und der dritte Schritt bestehen darin, 
eine spektrale Energie einer Untergruppe in den Audiodaten 
zu berechnen, die den Audiodatenstrom vor Auftreten des 
Fehlers darstellen, d. h. in den intakten Audiodaten, und 
dann eine Voriage fur Ersatzdaten aufgrund der fur die Un- 65 
tergruppe der intakten Audiodaten berechneten spektralen 
Energien zu bilden. Der letzte Schritt besteht dann darin, Er- 
satzdaten fur fehlerhafte oder nicht vorhandene Audiodaten 



aufgrund der \forlage fur die Untergruppe, fur die die Vbc- 
lage gebildet ist, zu erzeugen. 

Der erste Schritt besteht also im Erf as sen des Auftretens 
eines Fehlers. Falll der Eirigangsdalenstrom weg oder weist 
er Fehler auf, welche mittels geeigneter Einrichtungen bei- 
spielsweise zum ubeipriifen einer Prufsumme oder abnli- 
chem in einem codierten Audiosignal erfaBt werden konnen, 
kann beispielsweise ein bestimmter Anteil der Daten vor 
Auftreten dieses Fehlers z. B. in einem Ringpuffer gespei- 
cheit werden. 

Das Verfahren gemaB der vorliegenden Erfindung berech- 
net nun fur jede Untergruppe die spektrale Energie. Wah- 
rend die bekannte Variante zur linienweisen Pradiktion typi- 
scherweise das 20- bis 3 Of ache an Speicher und Rechenope- 
radonen im Vergleich zum Verfahren der vorliegenden Er- 
findung (wenn die Untergruppen den Frequenzgruppen ent- 
sprechen) benotigt, kann die spektrale Energie fur jede Un- 
tergruppe gemaB der vorliegenden Erfindung efficient und 
spars am berechnet werden. Es sei jedoch dennoch darauf 
Mngewiesen, daB der genannte Speicher- und Rechenopera- 
tioosaufwand lediglich bezfiglich der Fehlerverschleierung 
gilt Die Ges amtkomplexitat (Speicher oder Rechenzeit) 
beispielsweise eines kompletten MPEG-Layer- 3-Decodie- 
rers nimmt in der Regei nicht wesentlich zu. Wird dagegen 
eine linienweise Pradiktion eingesetzt, so wird der Gesamt- 
recbenaufwand des Codierers/Decodierers sehr wohl signi- 
fikant ansteigert 

Die spektrale Energie pro Untergruppe berechnet sich als 
Summe der Betragsquadrate der in der Untergruppe enthal- 
tenen Speklralkornponentjen. Die spektrale Energie pro Un- 
tergruppe entspricht also der Summe der quadrierten Iinien 
in dieser Untergruppe. Dies gilt sowohl bei der Verwendung 
einer MDCT als auch bei der Verwendung einer FFT fur die 
Zeit-Frequenz-lraixsformarion, urn zeitdiskrete "Audiosi- 
gnale in den Frequenzbereich zu transfonnieren, wie es bei 
modernen Codicrexn Gblich ist An dieser Stelle sei jedoch 
auf die vorher getnachten Anmeikungen hingewiesen, dafi 
„<H^MDCT im Gegensatz zur Fourier-Transformation nicht. 
exakt energieerhaltend isL 

Die spektrale Energie einer Untergruppe ist somit die 
Grundlage dafur, eine Vforlage fur Ersatzdaten zu bilden. Die 
Ersatzdaten sollen ein "sj^ktral-durchschmttfiches" Spek- 
trum im Sinne der Kurzzeitstatistik aufweisen. "Spekrral- 
durchschnittlich" bedeutet, daB ein Teil eines solchen Si- 
gnals, wenn er nach dem Verfahren der vorliegenden Erfin- 
dung ersetzt wird, nicht besonders aufrallen wird, d, h, daB 
die Ersetzung verschleiert ist, 

Aus EinfachheitsgrQnden findet die nachfoigende Dar- 
stellung der vorliegenden Erfindung anhand eines blockori- 
entierten Verfahrens dar, wie es bei den meisten modernen 
Audiocodierern der Fall ist Es sei jedoch darauf hingewie- 
sen, daB die vorliegende Erfindung nicht auf ein blockorien- 
tiertes Verfahren begrenzt ist Xbraussetzung fur das Verfah- 
ren ist, daB Infbrmationen fiber die spektrale Zusammenset- 
zung des Signales erhalten werden konnen, urn aus densel- 
ben die spektrale Energie pro Untergruppe zu berechnen. 
(Dies ist naturgemaB bei blockorientierten Transformadon- 
scodecs besonders einfach.) 

Zur Ernuttlung der Voriage, d. tu der Kurzzeitstatistik, fur 
Ersatzdaten werden in der Vergangenheit empfangene (in- 
takte) Daten verwendet Prinzipieil wtirde es auch mSglich 
sein, nach Einfugen einer \ferz6gerung in den Signalpfad 
"zukunftige" Daten nach einem Fehler zu verwenden und 
eine Interpolation diirchzufiJhretL Der Nachteii dabei be- 
steht jedoch in der bereits erwahnten Verzogerung. Das Ver- 
fahren der vorliegenden Erfindung wendet jedoch keine In- 
terpolation sondem eine Pradiktion an. \bn Pradiktion kann 
gesprochen werden, da das Ergebnis dieser Operation im- 
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mer ein zeitlich sp&ter liegenden Spektrum ist, das aiis zeit- 
lich fruheren Daten abgelcitcl winL Es werden also immer 
Audiodaien vor Auftreten eines Fchlcrs, d h. intakte Audio- 
daten, verwendet, urn im Falle eines auftrctenden Fehlers 
kunstlich erzeugte Ersatzdaten statt fehlerhafter Daten bzw. 
statt nicbt vcnhandener Daten einzufugen, urn den Fehler zu 
verschlciem. Trotzdem sei darauf hingewiesen, dafi der 
Ausdruck "PrSdiktion" in der Iiteratur rneist eager ausge- 
legt wird. Das Bilden einer Vorlage fur Ersatzdaten auf- 
grund der fur die Untexgruppe der intakten Audiodaten be- 
rcchneten spektralen Energie kann mehr oder weniger auf- 
wendig und daunt auch mehr oder weniger genau gestaltet 
sein. 

Fur die nachfolgend daigelegten eanzelnen Verfahren 
seien zuerst folgende Konventionen festgelegt So bedeutet 
X\ das Kurzzeitspektnirn, cL h. den \fcktor aus Kurzzeitspck- 
tralkDniponenten, eines Blocks i. E^(f) stellt die spektrale 
Energie einer Untergruppe der Mlttenfoequenz f im Block i 
dar, Dabei sei festgehalten, dafi i = 0 den zu pradizierenden 
Block, d. h. den Block von Ersatzdaten darstellt, wahrend 
negative i die gespeicherten Bldcke der intakten Audiodaten 
darstellen, und N der Anzahi der gespeicherten Bldcke eut- 
spricht Bv(0 moge fur die durch dieVarlage in der Untex- 
gruppe der Mitten£requenz f geforderte Energie stehen. 

Aufsteigend sortiert nach der Komplexit^t zur Berech- 
nung kommen folgende Verfahren zum Bilden einer Vorlage 
fur Ersatzdaten in Erage: 

1. Die spektralen Energien pro Untergruppe des zu- 
letzt empfangenen Blocks werden direkt als Vorlage 
fur den fehlenden Block verwendet. Dies kommt in fol- 
gender Gleichung zum Ausdruck: 

E v = E_i 

2. Die YDriage entsteht als lineaie Kombination von 
Potenzen der spektralen Energien entsprechender Un- 

tergruppen vergangener Blticke: 



welche jedoch nun zeitabhangige Koeffizienten aj(t) 
haben muB. Fur diesen Fall konnen auch in der Zukunft 
liegende Energien berechnet werden. Eine lineare ad- 
aptive Pradiktion zum Bilden der Vbrlage furErsatzda- 
5 ten ist dann besonders varteilhaft, wenn mehr als ein 
Block Daten im Datenstrom fehlen bzw. ersetzt werden 
mflssen. 

An dieser S telle sei angemerkt, dafi die vorstehende Liste 
10 zum Beiechnen einer Vodage fur Ersatzdaten keinen An- 
spruch auf Vbllstandigkeit erhebL Wichtig ist nur, dafi die 
Vbrlagc fur die Ersatzdaten einer Untergruppe aus spektra- 
len Energien einer bestirnmten Anzahi von vorausgehenden 
entsprechenden Untergruppen intakter Audiodaten erhalten 
t5 wircL 

Nachdem nun eine \farlage fur Ersatzdaten aufgrund der 
fur die Untergruppe der intakten Audiodaten berechneten 
spektralen Energie gebildet werden ist, besteht schlieSlich 
der letzte Schritt des Verfahrens darin, eben die Ersatzdaten 
20 zuerzeugen, die ansteUcvciifehlerhaften oder nichtvorhan- 
denen Audiodaten in den Audiodatenstrom eingesetzt bzw. 
substiuriert werden sollen. 

Es sollen Ersatzdaten erzeugt werden, die die gleiche 
spektrale Energie pro Untergruppe wie die Vorlage fQr die 
25 Ersatzdaten aufweisen sollen. Das grundsUlzliche \ferfahren 
besteht also darin, fehlerhafte bzw. nicht vorhandene Audio- 
daten, welche letztendlich S pektralkomponenten sein wer- 
den, durch kunstlich erzeugte Spektralkomponenten zu er- 
setzen. Die Randbedingung ist also, dafi die ktinstlich er- 
30 zeugten Spektralkamponenten in einer Untergruppe zusam- 
men dieselbe spektrale Energie aufweisen, die durch die 
Vorlage gegeben ist Dafur existieren versefctiedene M5g- 
lichkeiten. Es kQnnen beispielsweise alle Spektralwerte in 
~' einer Untergruppe gjeichgesetzt werden, wc^ei die GroBe 
3S der Spektralwerte oder Frequenzlinien dadurch gegeben ist, 
dafi die spektrale Energie derselben der entsprechenden 
spektralen Energie der \brlage entspricht 

Eine weit exe Mtt gk' chkeit konnte darin.bestehen, von vor- 



Ev(f) = S aiEi(f) 
i=-l 

Qi sind konstante Koeffizienten zur linearen Kombina- 
tion, wahrend b^ Expooenlen zur Gewichtung der ein- 
zelnen spektralen Energien sind. Der hier wiederum 
einfachste Fall ist die Mittelung, welche sich durch fol- 
gende Koeffizientenwerte darstellen IMfiU 

Qi = 1/N und bi = 1. 
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Die Vorlage fur Ersatzdaten kann auch durch Medianbil- 
dung fiber vergangene Energien erhalten werden. Dies sei 
durch folgende Gleichung dargestellt: 

Ev(f) = median {E^f), i = -l . . . -N} 

Bei der Medianbildung konnte allcrnativ auch das kleinste, 
das zweitkteinste das zweitgroBte oder das gr6Bte Ele- 
ment aus den Ej(f) verwendet werden. 

4. Die Vorlage fQr die Ersatzdaten aufgrund der fur die 
Untergruppe der intakten Audiodaten berechneten 
3ktralen Energie kann jedoch auch mittels einer line- 
adaptiven Pradiktion beiechnet werden. Dies ent- 
*. der im zweiten Fall dargelegten Gleichung, 
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neherein eine bestimmte Gewichtung festzulegen, welche 
darin bestehen konnte, Spektralwerte am Rand einer Unter- 
gruppe eher zu darnpfen und Spektralwerte in der Mitte ei- 
ner Untergruppe hervorzuheben. Die entsprechenden Spek- 
tralwerte zusammen rnussen jedoch dieselbe spektrale Ener- 
gie wie eine entsprechende Untergruppe der \brlage haben. 

Das bevorzugte Verfahren zum Erzeugen von Ersatzdaten 
besteht jedoch darin, alle Spektralkomponenten innerhalb 
einer Untergruppe auf gleich verteilte Zufallswerte X(f) zwi- 
schen -1 und +1 zu setzen, und nachtraglich eine Skalierung 
bzw. Normierung durchzufuhren, bei der das eben erzeugte 
Signal im Pegel so angehoben/abgeschwacht wird, dafi es 
innerhalb jeder Untergruppe die durch die Vorlage gefor- 
derte spektrale Energie besitzt 

Hierzu mufi nach der Erzeugung des Zufallssignals x jede 
Linie X(f>, welche per Definition einen Wert von zwischen 
-1 und +1 haben wird, innerhalb der entsprechenden Unter- 
gruppe mit folgendem Quotienten, der auch als Normie- 
rungsfaktor abezeichnet wird, multipliziert werden: 

a = V Ev(f k )' / 4 SX(f)2' ; 



f e Untergruppe der Mittenfrequenz ft 
EyCfic) stellt hier die spektrale Energie in der Vodage inner- 
halb einer Untergruppe k der Mittenfrequenz ft dar. EvKft) 
stellt also die Vorlage fur die Untergruppe k mit der Mitten- 
fiequenz ^ dar. 

Zur Vexeinfachung der vorherigen Vorschrift, urn auf die 
Summation im Nenner verzichten zu k6nnen, kann auch ein 
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Zuf alls signal erzeugt werden, welches zwischen +P und -P 
gleichverteilte Werte enthSll, wobei P folgendem Wert ge- 
niigen muB: 

P = V3E v (f k )' s 

Die Energie dieses Signals liegt dann mit bohcr Wahr- 
schdjDlichteit nahe bei der gefarderten Energie Ey(fk). Dies 
gilt sichedicb bei Untergruppen, die eine groBere (etwa 10) 10 
Anzahl von Frequenzlinicn enthalten. Dies liegt daran, daB 
das Quadratndttel aus gleichverteilten Werten zwischen -1 
und +1 gleich 1/3 ist 

Die nun eizeugten Ersatzdaten bzw. Spektralkompooen- 
ten fur die Untergruppe werden von einem Decodierer ge- t5 
nauso verarbeitet wie fehlerfreie Daten bzw. Spektralwerte. 
Aufgrund der Tatsache, daB mm die spektralen Energien der 
Untergruppen in den kunstlich eizeugten Daten den spektra- 
len Energies der Untergruppen im letzten intakten Block 
entspiechen oder aus den spektralen Energien von Unter- 20 
gruppen mehrerer vorausgebender Blocks abgeleitet sind, 
wild der Block nut kunstlich eizeugten Brsatzdaten bzw. die 
Biocke ndt kOnstlich erzeugten Ersatzdaten bei einigenna- 
Ben gjeichverteilter Signalstatistik des Audiosignals unhor- 
bar sein. Ein Fehler wild also verschleiert sein. 25 

Bei dem erfindungsgemaBen Verfahren zum Verschleiern 
von Fehlem in einem Audiodalenstrom kSnnen jedoch in- 
stationare Signale problematisch sein, da dann als Basis der 
Substitution mSglicherweise ein Block mit fur das Signal 
atypischer StatLstik verwendet wird. Urn zu verhindern, daB 30 
ein Block mit atypischer Statist ik, auf den unmittelbar ein 
fehlerhafter Block folgt, das Bilden einer \forlage fur Ersatz- 
daten fur den fehlerhaften Block domirriert, wodurch hor- 
bare Fehler eingeruhrt werden konnten, k-arm es gunstig 
sein, nicht nur den letzten intakten Block, sondern mchrere 35 
zuktzt vorhandene intakte B15cke zu speichem und dann fur 
eine eben genannte Pradiktion zu verwenden, urn eine \br- 
lage fur Ersatzdaten zu erhalten, die die groBere Teodenz des 
Signalverlaufs bzw. der Signalstatistik und nicht nur die Sta- 
tistik bzw. den Verlauf eines Blocks beriicksichtigL 40 

Ruth alt das ungestdrte oder intakte Signal oder der unge- 
storte oder intakte Audiodalenstrom eine prominente oder 
berausragende Spektralkomponente, die nahe am Rand ei- 
ner Untergruppe liegt, so wird ein durch das eben bescbrie- 
bene Verfahren erzeugtes innerhalb der Unter gru ppe gleich- 45 
verteiltes ("weisses^ Ranschen mit einer anderen Ibnhohe, 
namlich der Mittenfrequenz der Untergruppe, empfunden. 
Urn diesen EfFekt zu vermeiden, sollten die Untergruppen in 
Frequenzbereichen, in denen das Ohr auf solche TbnhShen- 
schwankungen empfindlich ist, schmal gewahlt werden, 50 
eventuell nur eine Frequenzlinie breit Im letzten Fall ver- 
einfacht sich das Verfahren, da - statt mit dem Betragsqua- 
drat der Spektralkompooente der Vbriage zu iechnen — di- 
rekt die Spektralkomponente der Vorlage mit einer aus 
-1) zufallig gewahlten Zahl multipliziert werden kann, ss 

Patentanspruche 

1. Verfahren zum Verschleiern von Fehlem in einem 
Audiodatenstrom mit folgenden Schritten: 60 
Erfassen des Auftretens eines Fehlers in einem Audio- 
datenstrom, wobei Audiodaten vor Auftreten des Feh- 
lers intakte Audiodaten sind; 

Berechnen einer spektralen Energie einer Untergruppe 
der intakten Audiodaten; 65 
Bilden einer Vorlage fur Ersatzdaten aufgrund der fur 
die Untergruppe der intakten Audiodaten berechneten 
spektralen Energie; und 
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Erzeugen von Ersatzdaten fur fehlerhafte oder nicht 
vorhandene Audiodaten, die der Untergruppe entspre- 
chen, aufgrund der \brlage. 

2. Verfahren nach Anspruch 1, 

bei dem der Audiodatenstrom aufeinanderfblgende Da- 
tenblocke aufweist, wobei ein Datenblock Audiodaten 
aufweist, die einer bestimmten zeitlichen Blockdauer 
entsprechen; 

bei dem bei Auftreten ernes fehlerhaften Datenblocks 
die spektralen Energien fur jede Untergruppe des letz- 
ten intakten Datenblocks berechnet werden; und 
bei dem die Ersatzdaten fur jede Untergruppedes feh- 
leifaaften Datenblocks die spektralen Energien der ent- 
sprechenden Untergruppe des letzten intakten Daten- 
blocks aufweisen. 

3. Verfahren nach Anspruch 1, 

bei dem der Audiodatenstrom aufeinanderfblgende Da- 
tenblocke aufweist, wobei ein Datenblock Audiodaten 
aufweist, die einer bestimmten zeitlichen Blockdauer 
entsprechen; 

bei dem bei Auftreten eines fehlerhaften Datenblocks 
die spektralen Energien fur entsprechende Untergrup- 
pen von zurnindest zwei vorausgehenden intakten Da- 
tenblocken berechnet werden; und 
bei dem die Ersatzdaten fur jede Untergruppe des feh- 
lerhaften Datenblocks rmttels Pradiktion aus den ent- 
sprechenden Untergruppen der zurnindest zwei voraus- 
gehenden intakten Datenbldcke ermittelt werden, 

4. Verfahren nach einem der vorhergeheoden Anspru- 
che, bei dem die spektralen Energien pro Untergruppe 
der Vorlage das Ergebrds einer linearen Kombination 
aus Potenzen der spektralen Energien entsprechender 
Untergruppen der vorausgehenden intalrtP^ Daten- 
blocke darstellen. „ ._. . . 

5. Verfahren nach einem der Ansprflche 1 bis 3, bei 
dem die spektralen Energien pro Untergruppe der Vor- 
lage das Ergebnis einer Mittelung uber die spektralen 
Energien entsprechender Untergruppen der vorausge- 

- henden intakten Datenbl5cke darstellen. - " 

6. Verfahren gemaB einem der Anspruche 1 bis 3, bei 
dem die spektralen Energien pro Untergruppe der Vor- 
lage durch Medianbildung uber die spektralen Ener- 
gien entsprechender Untergruppen der vorausgehenden 
intakten Datenbldcke entstehen. 

7. Verfahren gemaB einem der Anspruche 1 bis 3, bei 
dem die spektralen Energien pro Untergruppe der Vor- 
lage durch eine lineare adaptive Pradiktion uber die 
spektralen Energien entsprechender Untergruppen der 
vorausgehenden intakten Datenblocke entstehen. 

8. Verfahren gem&B einem der voibergehenden An- 
spruche, bei dem der Schritt des Erzeugens von Ersatz- 
daten folgende Schritte aufweist: 

Einstellen von Audiodaten innerhalb einer Unter- 
gruppe auf gleichverteilte Zuf allswerte zwischen -1 
und -1-1; und 

Skalieren der eingestellten Audiodaten, derart, daB die 
spektrale Energie der eingestellten Audiodaten der Un- 
tergruppe gleich der \brkgefurcne Ersatzdaten fur die 
Untergruppe der intakten Audiodaten ist 

9. Verfahren gemaB einem der voibergehenden An- 
sprflche, bei dem die Daten des Audi odatenstroms be- 
reits im Frequenzbereich vorliegen. 

10. Verfahren gema\B einem der voihergehenden A 
spruche, bei dem vor dem Erfassen des Auftreter' 
nes Fehlers in einem Audiodatenstrom fo 
Schritte ausgefiihrt werden: 

Empfangen des Audiodatenstioms; und 
Speichem zurnindest der zeitlich zuletz' 
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Daten des Audiodatenstroms in dex Reiheofblge, die 
durch den Audiodatcnstrom vorgegeben ist. 
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